2013/09/11

[Data Analytics] 巨資料的市場有多大?沒人知道

原文:Sizing The Big Data Market: No One Has A Clue – ReadWrite

[摘譯]
讓我們忘了那些關於巨資料(Big Data)的數據吧。真正的事實,是沒有人知道巨資料的商業市場表現,因為很少人真的知道到底什麼是巨資料。

Gartner 的副總 Ian Bertram 指出,50%的企業認為他們在巨資料議題上所遭遇的問題在於異質資料的統整 (variety),而非大量的資料 (volume) ([譯按] 巨資料有所謂的 3V:「多樣性」 variety,「大量」 volume,以及「速度」 velocity。),所以「巨」顯然不是個真議題。

Marketo 的 Jon Miller 說:「所謂的『巨資料』,是一個概略性的詞彙,意指一種極度大量、極度複雜的資料,超出了 1980 年代以來關聯式資料庫所能處理的範圍,所以亟需新的處理方式。」既然是一個「概略性的詞彙」,那我們怎麼能界定一個新的應用是不是屬於「巨資料」的範疇?

所以 Wikibon 嘗試估算巨資料產業的規模,我們就權且辜妄聽之吧。

我在想,會不會我們在說「巨資料」的時候,說的其實只是「資料」?我們所謂的「巨」並沒有實質的意義,只是我們可以把「比以前更多」的資料拿來發揮作用而已。

Ian Bertram 應該跟我所見略同,他說:
我很想問,為什麼要叫做「巨資料」?它到底「巨」在哪裡?為什麼不乾脆叫做「資料」或「資訊」?反正我們說的僅僅是從不同的資料來源抽取數據然後統整在一起,或許加上尋找特定型態,建立模型,指出風險,理解人的意圖與情感,建立網絡,這些事情而已。
換句話說,我們做的事情跟從前毫無差別:「讓資料發揮作用」,差別只是把工具換成 Hadoop 和 NoSQL,讓我們可以更有效率的做更多事情。

[譯按]
我喜歡這篇文章的副標題:
Big Data is a meaningless term that attempts to describe what we've spent years doing: putting data to work.
「巨資料只是一個無意義的字眼,試圖描述我們過去一直在做的事情:『讓資料發揮作用』」

前陣子在朋友轉貼的 Big Data 相關文章上回應:「Big Data 到現在已經成了行銷字眼,跟它起鬨你就紅了,跟它認真你就輸了」,大概也是差不多的意思。君不見我這兒正是在跟著Big Data 起鬨嗎?XD

沒有留言: